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摘要 : [目的 /意义 ] 研 究 时 间 因 素 对 专利 被 引 频 次 的 影响 ,可 以 减少 时 间 因 素 对 技术 评价 活动 的 制约 , 提 
高 评价 的 准确 性 和 可 信 度 。[ 方 法 /过程 ] 采 集 1975 -2017 年 的 美国 专利 数据 ,开展 基于 固定 效应 法 的 专利 被 
引 频 次 的 修正 研究 。 将 专利 按照 不 同 公 开 年 份 和 不 同 技术 领域 分 组 , 选 定 组 内 均值 和 6 个 TOP 分 位 数 为 被 引 
频次 基准 ,统计 当前 时 间 点 的 被 引 频 次 基准 线 及 基准 线 的 历史 时 序 变化 情况 。 建 立 神经 网 络 模 型 , 拟 合 基准 线 
的 时 序 变 化 规律 ,并 预测 未 来 统计 时 间 点 的 基准 线 。[ 结果/ 结论 ] 专利 公开 年 份 和 统计 年 份 的 时 间 差 异 ,使 得 
专利 被 引 频 次 无 法 直接 进行 比较 。 本 文 建立 了 基于 不 同 技 术 领 域 . 不 同 公开 年 份 和 不 同 统计 年 份 的 专利 被 引 


BARAR ,为 专利 评估 提供 参考 。 
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专利 引文 分 析 是 专利 分 析 的 重要 内 容 , 对 于 识别 
重 册 专利 探索 技术 发 展 路 线 以 及 评估 专利 价值 等 具 
有 重要 意义 。 专 利 引文 分 析 依赖 一 系列 专利 引文 测度 
指标 ,例如 ,引文 数量 和 被 引 频 次 等 。 在 实际 应 用 中 ， 
因 错 利 引文 产生 方式 的 多 样 性 和 专利 引文 所 揭示 含义 
的 圭 富 性 ,专利 引文 测度 指标 的 合理 使 用 有 待 深入 研 
究 岂 。 本 文 聚焦 于 专利 引文 测度 指标 的 时 间 影 响 研 
究 。 

时 间 因 素 对 引文 测度 指标 的 影响 ,一 直 受 到 国内 
外 学 者 们 的 关注 ” ,多 数 研究 聚焦 于 论文 引文 测度 
指标 的 时 间 影 响 研究 。 在 论文 引文 研究 的 基础 上 , 建 
立 了 学 术 界 广泛 认可 的 ESI (Essential Science Indica- 
tors) 体系 ,提供 了 基于 不 同 领域 .不 同时 间 范 围 的 引文 
指标 基准 值 ,用 于 消除 时 间 和 领域 因素 对 论文 引文 评 
价 指标 的 影响 。 但 是 在 专利 领域 ,缺少 类 似 实践 工作 ， 
尚未 形成 基于 不 同 领域 ,不 同时 间 范 围 的 基准 ,使 得 专 
利 引 文 测度 缺少 标准 ,无 据 可 依 。 

专利 引文 测度 指标 包括 两 个 基本 指标 和 一 系列 衍 


生 指 标 。 两 个 基本 指标 为 引文 数量 和 被 引 频次 。 其 
中 ,引文 数量 可 以 细 分 为 专利 引文 数量 和 非 专利 引文 
数量 ,衍生 出 技术 原创 性 .技术 普遍 性 等 指标 。 被 引 频 
次 则 街 生出 引证 指数 .科学 关联 性 .技术 实力 等 指标 。 
专利 引文 测度 指标 受 时 间 影响 , 主要 是 由 于 两 个 基本 
指标 受 时 间 影 响 。 这 两 个 基本 指标 中 ,被 引 频次 比 引 
文 数量 更 具 现 实意 义 。 本 文 关注 专利 引文 测度 指标 中 
的 被 引 频次 。 

B. H. Hall 在 2001 年 通过 人 研究 1975 - 1999 年 的 美 
辐 专利 引用 数据 ,最 早 提出 专利 被 引 频 次 的 时 间 影响 
问题 中 :OD 任何 专利 的 被 引 频次 都 只 是 截至 统计 时 间 
的 被 引 情况 ;@ 专 利 引用 受 专利 审查 制度 的 影响 ,不 同 
时 期 专利 审查 制度 有 差异 ,导致 专利 被 引 机 会 也 有 所 
不 同 。 后 续 的 一 些 实证 研究 发 现 , 除 美国 外 ,其 他 国家 
的 专利 被 引 频 次 也 有 类 似 表现 。 较 早期 的 研究 一 直 售 
留 在 时 间 影 响 的 现象 描述 上 ,直到 2014 年 ,万 小 丽 六 
受 B. H. Hall 的 研究 启发 ,详细 剖析 了 专利 被 引 频 次 受 
时 间 影响 的 原因 。 她 举例 说 明了 “时 间 截 面 "问题 和 
“引证 膨胀 "问题 “时 间 截 面 "问题 指 由 于 缺少 未 来 被 
引 频 次 ,专利 被 引 频 次 是 不 完整 统计 ;引证 膨胀 " 问 
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题 指 专利 引用 其 他 专利 的 平均 数量 逐年 增长 , 单 件 专 
利 的 被 引 机 会 越 来 越 大 。 不 仅 评价 单 件 专利 时 存在 上 
述 问 题 ,A. Breitzman 在 2015 年 发 现 ,评价 一 组 专利 的 
引用 情况 时 也 有 类 似 问 题 '“。 近 年 来 ,相关 研究 依然 
保持 热度 。2017 4E, A. B. Jaffe 在 回顾 专利 引用 的 相关 
社会 学 研究 时 ,再 次 强调 了 专利 被 引 频次 会 随时 间 累 
积 不 断 增 加 ,表现 出 强烈 的 队列 效应 (cohort 
effecis)  。 队 列 效应 是 社会 学 研究 中 的 重要 概念 ,这 
里 具体 是 指 :不 同时 期 的 专利 的 被 引 频次 受 时 间 影 响 
不 同 。 

梳理 相关 研究 成 果 后 ,发 现时 间 对 专利 被 引 频次 
的 影响 主要 在 于 三 个 方面 :专利 公开 时 间 越 接近 统 
计时 间 点 ,被 引 频次 越 低 。 不 同年 份 公开 专利 的 被 引 
频次 ,无 法 直接 进行 比较 ;@ 计 算 机 技术 的 快速 进步 ， 
提高 了 专利 审查 员 的 检索 能 力 ,导致 专利 被 引 机 会 逐 
年 增 大 。 因 此 ,无 法 直接 比较 在 相同 时 间 间 隔 下 ,不同 
公开 专利 的 被 引 频次 ;@ 只 能 计算 截至 统计 时 间 
点 的 专利 被 引 频次 ,未 来 被 引 频次 难以 预知 ,导致 评价 
第 轻 专 利 时 误差 较 大 。 这 三 个 问题 均 是 评价 专利 的 公 
PAR HRIH EHR AEN 
CAJ 基 于 以 上 现状 ,本 文 旨 在 研究 时 间 因 素 对 专利 被 
引 珊 次 的 影响 ,以 解决 专利 不 同 公开 年 份 和 不 同 统计 


思 的 时 间 差异 引起 的 测度 问题 。 
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2 数据 与 方法 
2. 扣 数据 采集 及 处 理 
:三 本 文 的 研究 数据 从 DI 数据 库 (Derwent Innova- 


tion) 中 采集 。 美 国 专利 引用 信息 更 完备 , 故 本 文选 择 
美国 为 研究 对 象 。 美 国 的 专利 引用 数据 从 1975 EF 
有 计算 机 化 , 故 数据 范围 限定 为 美国 1975 - 2017 年 公 
开 的 所 有 专利 记录 及 其 施 引 专利 记录 。 

研究 数据 集 分 为 1 基础 专利 集合 条 施 引 专利 集 
合 。 I 基础 专利 集合 为 主要 数据 集 , 即 美国 1975 - 
2017 年 公开 的 所 有 专利 记录 。 开 施 引 专利 集合 为 扩展 
数据 集 , 即 基础 专利 集合 中 所 有 专利 的 施 引 专利 集 
合 。 采 集 的 专利 著录 字段 见 表 1。 

数据 采集 及 处 理 过 程 如 图 1 所 示 。 采 集 工 基础 专 
利 数据 时 ,限定 检索 库 为 美国 授权 专利 库 和 美国 专利 
申请 库 ,检索 式 为 “DP > = (19750101) AND DP < = 
(20171231)”, 检 索 时 间 为 2018 年 1 月 20 日 , 共 得 到 
11 742 361 条 记录 。 采 集 芽 施 引 专利 数据 时 , 先 从 I 基 
础 专利 集合 提取 施 引 专利 的 公开 号 ,去 重 后 得 到 公开 号 
列表 ,用 于 公开 号 检索 ,最 终 得 到 19 953 069 条 记录 。 
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表 1 数据 集 著录 字段 及 含义 
专利 集合 字段 名 
I 基础 专利 集合 : 美 ”1 公开 号 ;2 标题 ;3 申请 号 ;4 申请 日 期 ;5 公开 日 
E 1975 - 2017 年 期 ;6 公开 年 ;7 IPC 部 ;8 IPC 现 版 完整 ;9 DWPI 分 
的 所 有 专利 记录 。” 类 ;10 DWPI 手工 代码 ;11 施 引 专利 ;12 施 引 专利 
计数 ;13 施 引 专利 详细 信息 
1 


公开 号 ;2 公开 年 


$ 


TL j| UAE dE 
础 专利 集 的 施 引 专 
利 集合 


RT 


数据 处 理 阶 段 包括 数据 库 构建 、 缺 失 值 处 理 .异常 
记录 筛 查 和 数据 合并 更 新 等 。 其 中 ,数据 合并 更 新 步 
又 是 :将 工 基础 专利 集合 的 专利 记录 ,按照 相同 申请 号 
字段 合并 ,去 重 ,公开 年 和 公开 有 日 期 字段 保留 重复 记录 
中 的 最 早 公开 年 和 公开 日 期 , 施 引 专利 字段 取 重 复 记 
录 中 施 引 专 利 的 并 集 。 数 据 合并 更 新 的 原因 是 :一 项 
美国 专利 ,从 提交 申请 到 授权 阶段 可 能 生成 多 个 公开 
文件 ,在 DI 数 据 库 中 出 现 多 条 记录 ,然而 这 些 记 录 的 
被 引 情 况 并 不 是 完全 一 致 。 


图 1 数据 采集 及 处 理 过 程 


2.2 研究 思路 及 方法 

本 文 研究 思路 如 下 :首先 ,针对 专利 被 引 频 次 受 时 
间 影 响 缺少 评 价 标准 的 现状 ,梳理 相关 研究 ,发 现时 
间 因 素 引 起 专利 被 引 频 次 无 法 直接 比较 的 关键 问题 在 
于 专利 不 同 公开 年 份 和 不 同 统计 年 份 的 时 间 差 异 。 其 
次 ,为 了 消除 该 时 间 影 响 ,总 结 专 利 被 引 频次 的 时 间 影 
响 的 修正 方法 ,筛选 出 合适 的 修正 方法 : 百 分 位 数 、 相 
对 影响 指标 及 国定 效应 法 。 最 后 ,在 采集 处 理 专 利 数 
据 的 基础 上 ,采用 选 定 的 修正 方法 ,开展 基于 当前 时 间 
点 及 基于 时 序 变化 的 时 间 影 响 修正 研究 。 见 图 2。 


3 专利 被 引 频次 的 时 间 影 响 修正 


时 间 因 素 对 引文 测度 影响 的 修正 方法 ,可 以 细 分 
为 相对 影响 指标 "5 .加 入 时 间 因 子 " .引证 窗口 选 
"77 、 百 分 位 数 “， 中 模拟 分 布 曲线 ”和 引入 非 引 
用 指标 “等 。 在 论文 领域 中 ,相对 影响 指标 和 百 分 
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专利 被 引 频 次 受 时 间 因 素 影响 ， 
缺少 评价 标准 


关键 问题 ， 专 利 不 同 公开 年 份 和 不 同 统 计 
年 份 的 时 间 差 异 引 起 的 测度 问题 


| 
| 
相关 研究 梳理 | 
1 
1 
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rcr ml see rir p E 


梳理 引文 测度 的 时 间 影 响 修正 方法 


方法 选择 


方法 : 百 分 位 数 、 相 对 影响 指标 
固定 效应 法 


I 设计 实验 流程 


1) 专利 数据 采集 、 处 理 
2) 对 专利 被 引 频 次 的 时 间 影 响 的 修正 
… 基 于 当前 时 间 点 的 修正 
… 基 于 时 序 变 化 的 修正 及 对 未 来 时 间 点 的 预测 


图 2 研究 思路 


停 要 方法 常 被 用 于 多 个 学 和 领域 和 不 同 指标 的 修正 ， 
透 册 面 很 广 ,其 他 方法 大 多 应 用 于 某 一 特定 学 科 领 域 
stb, 普 适 性 有 待 验证 。 在 专利 领域 ，B， 开 
HD 针对 美国 专利 商标 局 受理 的 1969 — 1999 年 专利 
议 献 ,计算 了 截至 1999 年 底 的 专利 被 引 频 次 的 均值 ， 
捍 国 用 固定 效应 方法 来 进行 专利 被 引 频次 指标 的 标准 
(cre n piat dudas 
EB 利 的 相对 被 引 频 次 , 即 用 一 项 专利 的 绝对 被 引 频 
次 院 以 该 专利 所 在 技术 领域 同年 授权 专利 的 平均 被 引 
频次 。 固 定 效应 (fxed effect) 最 早 是 实验 设计 的 基本 
棕 系 ,是 指 在 实验 中 选取 某 观察 因素 的 水 平 效应 作为 
固定 参数 。 在 统计 学 中 ,国定 效应 是 模型 参数 固定 的 
王 禹 统计 模型 。 例 如 ,将 数据 按照 几 个 因素 分 组 ,选取 
分 缠 后 的 组 内 均值 为 每 个 小 组 的 固定 效应 。 

综合 论文 和 专利 领域 的 修正 方法 ,本 文采 用 固定 
效应 方法 ,选择 专利 被 引 频 次 的 均值 和 TOP 分 位 数 作 
为 基准 ,对 专利 被 引 频 次 的 时 间 影响 进行 修正 。 假 设 
专利 被 引 频次 随 公 开 年 份 和 统计 年 份 的 推移 引起 的 变 


同 技术 领域 (IPC 部 ) 和 不 同 公开 年 分 组 后 ,计算 的 基 
准 线 见 表 2 和 表 3。 其 中 表 2 表示 组 内 均值 , 表 3 表示 
组 内 TOP 分 位 数 水 平 。TOP 分 位 数 表示 各 个 TOP A 
分 位 水 平 的 专利 被 引 频 次 的 值 , 共 选 取 了 6 个 TOP 分 
位 数 ,分 别 为 TOP0.01% (排名 前 0.01% ) ,TOPO. 10% 
(排名 前 0. 1096) , TOPI. 00% (排名 前 1. 0096) 
TOP10.00% (排名 前 10. 00% ) , TOP20. 00% (排名 前 
20.00% ) 和 TOP 50. 00% (排名 前 50.00% ) 。 图 3 是 
表 2 的 图 形 化 描述 。 截 至 2017 年 底 , 全 领域 和 不 同 技 
术 领 域 专利 被 引 频 次 的 均值 ,都 随 着 公开 年 的 增长 呈 
现 出 先 增加 后 下 降 的 趋势 。 近 十 几 年 间 公 开 专 利 被 引 
频次 均值 的 下 降 是 因为 受到 统计 时 间 截 断 的 影响 ,新 
公开 的 专利 还 没有 被 在 后 公开 的 专利 充分 引用 。 早 些 
年 公开 的 专利 可 以 近似 认为 不 受 统计 时 间 的 截断 影 
响 ,容易 发 现 ,不 同年 份 公开 的 专利 的 被 引 情 况 差 别 较 
大 。 对 比 不 同 技术 领域 的 专利 被 引 频 次 ,发 现 不 同 技 
术 领 域 峰值 所 对 应 的 公开 年 份 有 差异 ,如 A 部 (人 类 
生活 必需 ) 在 公开 年 为 1996 年 时 专利 被 引 频 次 均值 达 
到 峰值 ,而 6G 类 (物理 ) 则 是 在 公开 年 为 2000 年 时 达 
到 峰值 。 不 同 技术 领域 的 专利 被 引 频次 均值 的 大 小 也 
有 差异 ,如 A 部 (人 类 生活 必需 ) 专利 的 被 引 频 次 均值 
明显 高 于 其 他 各 部 ,G 部 (物理 ) 和 日 部 (电学 ) 专 利 的 
被 引 频 次 均值 大 小 接近 ,D 部 (纺织 ;造纸 ) 各 年 公开 专 
利 的 被 引 频 次 均值 最 低 。 

评价 单 件 专利 时 ,根据 公开 年 和 IPC 部 找到 该 专 
利 对 应 的 分 组 ,用 该 专利 的 被 引 频 次 除 以 表 2 中 的 组 
内 均值 ,或 者 将 其 与 表 3 中 TOP 分 位 数 水 平 进行 比 对 。 
可 以 分 别 用 于 修正 公开 年 或 技术 领域 的 影响 。 

评价 专利 集合 时 ,可 以 计算 该 专利 集合 的 被 引 频 
次 加 权 值 。 把 专利 集合 中 的 专利 按 公 开 年 和 IPC 部 进 
行 分 组 ,找到 表 3 中 对 应 小 组 的 TOP 分 位 数 。 按 照 
TOP 分 位 数 将 专利 被 引 频 次 划分 到 7 个 百 分 位 区 段 : 


化 都 是 系统 性 变化 ,在 比较 不 同 专利 的 被 引 频 次 时 需 
要 消除 这 种 变化 。 将 专利 按照 不 同 公开 年 份 和 不 同 统 
计 年 份 分 组 ,选取 组 内 均值 和 TOP 分 位 数 作为 每 个 小 
组 的 国定 效应 。 因 为 不 同 技术 领域 的 专利 被 引 情况 差 
别 较 大 ,所 以 分 组 时 还 加 入 了 技术 领域 类 别 。 

修正 研究 分 为 基于 当前 时 间 点 的 修正 和 基于 历史 
时 序 变化 的 修正 。 不 仅 为 当前 时 间 点 的 专利 评估 提供 
基准 线 ,还 通过 拟 合 基 准 线 的 历史 时 序 变化 规律 ,对 未 
来 时 间 点 的 基准 线 进 行 预测 。 
3.1 基于 当前 时 间 点 的 基准 线 

统计 时 间 点 为 2017 年 底 时 ,专利 被 引 频次 按照 不 


高 于 或 等 于 TOPO. 0196, TOPO. 01% - 0. 1096, 
TOPO. 10% — 1.0096 TOP1.00% — 10. 00% , TOPIO. 0096 — 
20. 00% ,TOP20. 00% — 50.0096 和 低 于 TOP50.00% ,并 
计算 每 个 百 分 位 区 段 中 专利 数 占 总 集合 专利 数 的 比 
例 。 不 同 百 分 位 区 段 赋予 不 同 权 重 ,用 百 分 位 区 段 对 
应 权重 乘 以 该 百 分 位 区 段 的 专利 数目 占 比 , 求 和 后 得 
到 被 引 频 次 的 加 权 值 。 

3.2. 基于 时 序 变化 的 基准 线 及 预测 

3.2.1 基于 历史 时 序 的 基准 线 ”专利 被 引 频 次 随 着 
统计 年 份 的 推移 而 增加 。 在 不 同 统计 年 份 ,被 引 频次 
的 均值 和 TOP 分 位 数 水 平 不 同 。 前 人 研究 中 ,大 多 是 
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> 注 : 图 中 字母 代表 IPC 部 ,含义 分 别 为 :A - 人 类 生活 必需 ;B - 作业 .运输 ;C -化 学 、 冶 金 ;D - 252. 
N 造纸 ;E - EEES F - 机 械 工程 .照明 ,加热 .武器 .爆破 ;G -物理 ;H -电学 。 总 体 代 表 全 领域 。 下 同 
"T 图 3 不 同 公开 年 份 的 美国 专利 被 引 频 次 均值 变化 情况 
© R2 不 同 技术 领域 下 不 同 公开 年 份 专利 的 被 引 频次 均值 示例 
a 公开 年 A 部 B 部 C 部 D 部 E Fi G 部 Hk 所 有 类 
E 1975 27.04 19.26 14.85 14. 00 21.81 19.36 18. 59 18.43 18. 70 
eo 1976 28.50 21.03 16.30 16. 09 25.04 20.90 20. 78 20. 59 20.27 
N 1977 29.29 21.58 17.48 17.96 25.50 22.05 21.62 22.36 21.23 
Qas 1.94 1.61 1.09 1.43 1.52 1.54 2.21 2.35 1.96 
2.2016 0.76 0.67 0.40 0.51 0. 59 0.65 0.87 0.987 0. 79 
> 2017 0.10 0.11 0.057 0.07 0.09 0.11 0.14 0.176 0.13 
ae 所 有 年 26. 85 18.18 16.92 18. 10 20.22 17.14 23.53 22.26 21.01 
© 表 3 不 同 技术 领域 下 不 同 公开 年 份 专利 的 被 引 频 次 TOP 分 位 数 示例 
amm 公开 年 IPC 部 TOPO. 01% TOPO. 10% TOP1. 00% TOP10. 00% TOP20% TOP50% 
Æ 1975 A 1 982.16 520.52 188 58 36 15 
Q 1975 B 521.88 265.06 106 42 28 13 
1975 C 548.85 269.49 103 34 21 8 
1975 D 434. 08 293.3 92.15 30. 50 20 8 
1975 E 402.17 276.97 120.44 45 33 15 
1975 F 532.71 226. 68 103 42 29 13 
1975 G 789.15 324.85 119 41 26 11 
1975 H 564.47 263 125 40 26 11 
1975 全 类 别 1 068.81 321.51 119 41 27 11 
1976 A 924. 71 510.91 222.56 62 39 15 
1976 B 485.96 254 117 45 31 14 
2016 H 84 41.47 10 3 2 0 
2016 全 类 别 90. 65 41 10 2 1 0 
2017 A 19 7 2 0 0 0 
2017 B 11 5 2 0 0 0 
2017 C 12 5 2 0 0 0 
2017 D 4 3.83 2 0 0 0 
2017 E 6 5 2 0 0 0 
2017 F 12 8 2 0 0 0 
2017 G 15 6 2 0 0 0 
2017 H 30 9 3 1 0 0 
2017 全 类 别 25 9 3 0 0 0 
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基于 当时 的 统计 年 份 。 本 文 基于 不 同 的 统计 年 份 , 计 
算 专利 被 引 频 次 的 均值 和 TOP 分 位 数 ,探讨 专利 被 引 
频次 基准 线 的 逐年 变化 情况 和 增长 规律 。 在 此 基础 
上 ,根据 历史 数据 对 基准 线 进行 拟 合 ,预测 未 来 统计 年 
份 的 基准 线 ,为 未 来 的 专利 评估 提供 参考 。 

图 4 显示 了 不 同 公开 年 份 专利 在 不 同 统计 年 份 的 
被 引 频 次 均值 分 布 情况 。 图 5 显示 了 八大 技术 领域 下 
不 同 公开 年 份 专利 在 不 同 统计 年 份 的 被 引 频次 均值 分 
布 情况 。 图 4 和 图 5 中 ,X 轴 表 示 专 利 公开 年 份 ,Y 轴 
表示 专利 统计 年 份 ,Z 轴 表 示 专 利 被 引 频次 均值 。 从 
全 领域 的 被 引 频次 均值 变化 情况 来 看 ,固定 公开 年 不 
变 时 ,被 引 频次 均值 随 着 统计 年 的 增长 呈现 上 升 趋势 ; 
固定 统计 年 不 变 时 ,被 引 频次 均值 随 公 开 年 的 增长 呈 
完 增 后 减 的 趋势 。1985 年 之 前 公开 的 专利 ,被 引 频次 
均值 随 统计 年 增加 的 增长 速率 比较 平缓;1985 - 1990 

公开 的 专利 ,被 引 频 次 均值 随 统计 年 增加 的 增长 
en UO n 
TEBESA KERER. ERY BBH 
We 
绕 池 时 间 增加 的 增长 速率 越 快 。 这 一 现象 可 能 是 因为 
读 往 机 技术 的 快速 进步 ,使 得 专利 审查 员 的 检索 能 
提出 ,从 而 专利 被 引 机 会 逐年 增 大 。 对 比 不 同 领域 的 
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被 引 频 次 均值 变化 情况 ,A 部 (人 类 生活 必需 ) LC 部 
(化 学 ;冶金 ) G 部 (物理 ) .H 部 (电学 ) 的 专利 被 引 频 
次 随 公 开 年 份 和 统计 年 份 变化 的 形态 相似 , 与 全 领域 
的 变化 规律 类 似 。B 部 (作业 ;运输 ) 下 部 (机 械 工 程 ; 
照明 ;加 热 ; 武 器 ;爆破 ) 的 专利 ,被 引 频 次 均值 随 统计 
年 增加 的 增长 速率 变化 较为 平缓 。E 部 ( 固定 建筑 物 ) 
的 专利 在 固定 专利 公开 年 时 ,被 引 频 次 随 统计 时 间 递 
增 的 增长 速率 先 慢 后 快 ,在 统计 年 为 2005 年 时 有 明显 
转折 。D 部 (纺织 ;造纸 ) 的 专利 在 国定 专利 统计 年 时 ， 
被 引 频 次 均值 随 公开 年 递增 呈 上 下 波动 的 趋势 ,而 其 
他 各 部 的 专利 被 引 频次 则 是 随 公 开 年 递增 呈 先 增 后 降 
的 趋势 。 

除 被 引 频 次 均值 外 ,被 引 频次 TOP 分 位 数 分 布 示 
例 见 图 6 和 图 7。 图 6 为 不 同 公开 年 份 专 利 在 不 同 统 


计 年 份 的 被 引 频次 TOP1. 00% 分 位 数 分 布 情况 。 不 同 
IPC 技术 领域 下 ,不 同 公开 年 份 专 利 在 不 同 统计 年 份 
的 被 引 频 次 TOP 分 位 数 分 布 差异 较 大 。 作 为 示例 ,图 
7 给 出 了 IPC 领域 中 的 A 部 和 B 部 的 TOP 1.00% 分 位 
数 分 布 情况 。 图 6 和 图 7 中 ,X 轴 表 示 专 利 公 开 年 份 ， 
Y 轴 表 示 专 利 统计 年 份 ,Z 轴 表 示 专 利 的 TOP1. 00% 分 
位 数 。 
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4 不 同 公开 年 份 专利 截至 不 同 统计 时 间 的 被 引 频次 均值 变化 
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图 5 八大 技术 领域 下 不 同 公开 年 份 专利 截至 不 同 统计 时 间 的 被 引 频次 均值 变化 
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6 不 同 公开 年 份 专利 截至 不 同 统计 时 间 的 被 引 频 次 TOP1. 00% 分 位 数 示 例 


B 部 


被 引 频次 TOP1.00% 分 位 数 
被 引 频次 TOP1.00% 分 位 数 


注 :图 中 字母 代表 IPC 部 ,含义 分 别 为 :A - 人 类 生活 必需 ;B -作业 运输 


7 不 同 技术 领域 下 不 同 公开 年 份 专利 截至 不 同 统计 时 间 的 被 引 频次 TOP 1. 00 多 分 位 数 示例 


3.2.2 基于 BP 神 经 网 络 模型 的 基准 线 预测 “本 文采 
用 BP 神经 网 络 模型 ,预测 未 来 统计 时 间 点 的 专利 被 引 
频次 基准 线 。BP( Back Propagation ) 神经 网 络 模型 由 美 
国 的 PDP(Parallel Distributed Processing ) 研究 小 组 提 
出 。 网 络 结构 如 图 8 所 示 ,分 为 输入 层 .隐藏 层 和 输出 
层 。 训 练 过 程 分 为 前 向 传播 过 程 和 反 向 传播 过 程 。 前 
向 传播 过 程 是 :将 输入 样本 提供 给 输入 单元 , 逐 层 向 前 
传播 输入 信和 号 ,直到 产生 输出 层 的 结果 。 反 向 传播 过 
程 是 : 先 对 照 实际 结果 计算 输出 层 误差 ,将 误差 反 向 传 
播 到 隐藏 层 神经 元 ,再 根据 神经 元 误差 ,采用 梯度 下 降 
算法 对 连接 权 值 和 偏 置 进行 优化 。 
(1) 数 据 准 备 。 将 3.3.1 中 基于 历史 时 序 的 基准 
线 统计 结果 作为 拟 合 数据 集 ,按照 是 否 划分 IPC 领域 、 


输入 层 MAE 输出 层 
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í XX l "n 
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8 BP 网 络 结构 


基准 值 取 均 值 还 是 TOP. 分 位 数 ,将 数据 集 划 分 成 4 部 
分 : 

。 数据 集 A。 取 1975 -2017 年 中 某 年 为 统计 年 ， 
计算 所 有 公开 年 专利 截至 该 统计 年 时 被 引 频 次 的 均 
值 , 共 946 条 数据 记录 。 

。 数据 集 B。 将 专利 按照 IPC 部 划分 后 , 取 1975 
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-2017 年 中 某 年 为 统计 年 ,计算 所 有 公开 年 专利 截至 
该 统计 年 时 被 引 频次 的 均值 , 共 7 568 条 数据 记录 。 

e 数据 集 C。 取 1975 -2017 年 中 某 年 为 统计 年 ， 
计算 所 有 公开 年 专利 截至 该 统计 年 时 被 引 频次 的 TOP 
分 位 数 , 共 946 条 数据 记录 。 

。 数据 集 D。 将 专利 按照 IPC 部 划分 后 , 取 1975 
-2017 年 中 某 年 为 统计 年 ,计算 所 有 公开 年 专利 截至 
该 统计 年 时 被 引 频次 的 TOP. 分 位 数 , 共 7 568 条 数据 
记录 。 

(2) 模 型 构建 。 

。 模 型 A。 模 型 A 的 输入 数据 是 数据 集 A。 输 入 
层 设 置 4 个 神经 元 ,代表 公开 年 .被 引 公开 年 .时 间 间 
隔 和 专利 数量 字段 。 输 出 层 设置 1 个 神经 元 ,代表 被 
引 由 次 均值 。 隐 基层 取 1 层 结构 。 隐 藏 层 神经 元 数 的 
下定 原则 为 :在 满足 精度 的 前 提 下 , 取 尽 可 能 少 的 隐藏 
层 神经 元 数 。 根 据 式 (1) 设 置 神经 元 数目 。 
h= m * n 4 a XD) 
OOH h 为 隐藏 层 神经 元 数 ,m 为 输入 层 神经 元 数 ， 
n plus th e Ea a 为 1 - 10 之 间 的 调节 常数 。 模 
A rp ,隐藏 层 神经 元 个 数 应 该 在 4 - 12 范围 内 。 在 
上 埠 退 围 内 ,设置 不 同 的 神经 元 个 数 ,计算 预测 误差 , 找 
ge FE I EUR M ER TC 
sse BUS B, BUS B 的 输入 数据 是 数据 集 B。 输 入 
RE 5 个 神经 元 ,代表 IPC 部 公开 年 .被 引 公开 年 、 
时 间 间 隔 和 专利 数量 字段 。 输 出 层 ,隐藏 层 的 设置 与 
EOU A 相同 。 
三 。 模 型 C。 模 型 B 的 输入 数据 是 数据 集 C。 预 测 
模 王 的 输入 层 设置 4 个 神经 元 ,代表 公开 年 .被 引 公开 
年 .时 间 间 隔 和 专利 数量 字段 。 输 出 层 设置 6 个 神经 
元 ,代表 TOPO. 0196 , TOPO. 1096 , TOP1. 0096 , TOP 
10. 0096 , TOP20. 0096 、TOP50. 0096 分 位 数 。 根 据 公 式 
(1) ,神经 元 个 数 应 该 为 5 - 13 之 间 。 在 此 范围 内 , 设 
置 不 同 的 神经 元 个 数 ,计算 预 测 误差 ,找到 最 佳 的 隐藏 
层 神经 元 数 。 

。 模 型 D。 模 型 D 的 输入 数据 是 数据 集 D。 输 入 
层 设置 5 个 神经 元 ,代表 IPC 部 .公开 年 .被 引 公开 年 、 
时 间 间 隔 和 专利 数量 字段 。 输 出 层 .隐藏 层 的 设置 与 
数据 集 C 相同 。 

(3) 模型 训练 。 模 型 训练 采用 GroupKFold( 分 组 k 
折 验 证 ) 方 法 ,将 4 个 数据 集 分 别 按 统计 年 份 分 组 , 同 
组 的 样本 会 同时 分 给 训练 集 或 者 测试 集 。 设 置 K 为 
10 ,将 数据 集 分 成 10 份 ,轮流 将 其 中 9 份 作为 训练 数 
据 ,1 份 作为 测试 数据 ,进行 实验 。 
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(4) 模 型 评价 指标 。 本 文选 取 MAE (mean absolute 
error ,平均 绝对 误差 ) 和 MSE (mean squared error ,平均 
平方 误差 ) 两 个 指标 对 模型 进行 评估 。MAE 按 公 式 
(2) 求 解 ,MSE 按 公 式 (3) 求 解 。 


MAE =+ 5 If, - y 式 (2) 


MSE - 3 (f, =y)? 式 (3) 


(5 ) 模 型 评估 及 预测 。 

e 模型 A。 固 定 隐 藏 层 神经 元 数量 为 4, 调 整训 
练 次 数 epochs ,记录 不 同 训练 次 数 的 预测 误差 ,结果 见 
图 9。 由 MAE 和 MSE 变化 曲线 可 知 ,训练 次 数 为 100 
时 , 拟 合 效 果 趋 于 稳定 。 设 置 训 练 次 数 为 100 ,隐藏 层 
神经 元 个 数 分 别 为 4.5.6 7.8.9 10 11 12 ,发现 当 隐 
藏 层 神经 元 个 数 为 12 时 ,MAE 和 MSE 值 最 小 ( 见 图 
10) 。 作 为 参考 示例 ,图 9 和 图 10 分 别 给 出 不 同 训练 
次 数 的 预测 误差 曲线 和 隐藏 层 不 同 神经 元 数目 的 预测 
误差 曲线 ;后 文 将 不 再 显示 其 余 模型 的 曲线 变化 图 。 
模型 A 中 ,最 终 设置 训练 次 数 epochs 为 100 ,隐藏 层 神 
经 元 个 数 为 12。 

模型 A 的 最 佳 性 能 曲线 如 图 11 所 示 。 横 轴 代 表 
样本 的 统计 年 份 , 纵 轴 代 表 被 引 频 次 均值 。 蓝 色 为 实 
际 值 ,红色 为 预测 值 ,绿色 为 两 者 的 差 值 。 从 性 能 曲线 
来 看 ,整体 拟 合 效果 较 好 。 

由 模型 A 可 以 预测 截至 未 来 某 统计 年 份 时 ,不 同 
公开 年 专利 的 被 引 频 次 均值 。 图 12 是 一 个 预测 实例 ， 
表示 统计 年 份 为 2018 年 时 ,1975 -2017 年 公开 专利 的 
被 引 频 次 均值 预测 曲线 。 横 轴 代 表 专 利 公 开 年 份 , 纵 
代表 被 引 频 次 均值 。 

。 模型 B。 固 定 隐 藏 层 神经 元 数量 为 4, 调 整训 
练 次 数 epochs, 记录 不 同 训练 次 数 的 预测 误差 。 由 
MAE 和 MSE 变化 情况 得 到 ,训练 次 数 达 到 500 时 , 拟 
合 效果 趋 于 稳定 。 设 置 训 练 次 数 为 500 ,隐藏 层 神经 
元 个 数 分 别 为 4.5、6、7、8、9、10、11、12, 发 现 当 隐藏 层 
神经 元 个 数 为 12 时 ,MAE 和 MSE 值 最 小 。 模 型 B 中 ， 
最 终 设 置 训练 次 数 epochs X 500 ,隐藏 层 神 经 元 个 数 
为 12。 

模型 B 的 最 佳 性 能 曲线 如 图 13 所 示 。 横 轴 代 表 
不 同 技术 领域 下 样本 的 统计 年 份 , 纵 轴 代 表 被 引 频 次 
均值 。 蓝 色 为 实际 值 , 红 色 为 预测 值 ,绿色 为 两 者 的 差 
值 。 性 能 曲线 显示 ,被 引 频 次 均值 的 变化 幅度 小 的 技 
术 领 域 (如 B 部、D 部 等 ) , 拟 合 效果 更 好 ;变化 幅度 较 
大 的 技术 领域 (如 A 部 ) , 拟 合 效果 还 需 增 强 。 
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图 9 模型 A 中 不 同 训练 次 数 的 预测 误差 


—=MAE train 
0018 -一 MIAE test 


0016 


0014 


0012 


M ox 


0.010 


0.008 


神经 元 个 数 
图 10 模型 A 中 隐藏 层 不 同 神经 元 数目 的 预测 误差 


— Actual values 
|— Predicted values 


|— D-value 


30 


SALAH 
b2 
> 


1975 1990 1995 2000 2005 2010 2015 2017 
公开 年 【单位 : 年 份 ) 


图 11 模型 A 的 最 佳 性 能 曲线 
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由 模型 B 可 以 预测 截至 未 来 某 统计 年 份 时 ,不 同 
技术 领域 下 ,不 同 公开 年 专利 的 被 引 频次 均值 。 图 14 
是 一 个 预测 实例 ,表示 统计 年 份 为 2018 年 时 ,不 同 技 
术 领 域 下 ,1975 - 2017 年 公开 专利 的 被 引 频 次 均值 预 
测 曲线 。 横 轴 代 表 专利 技术 领域 与 公开 年 份 , 纵 轴 代 
表 被 引 频 次 均值 。 

。 模 型 C。 固 定 隐藏 层 神经 元 数量 为 5, 调 整训 练 
次 数 epochs ,记录 不 同 训练 次 数 的 预测 误差 。 由 MAE 和 

0 MSE 变化 情况 得 到 ,训练 次 数 设置 为 500 及 以 上 时 , 拟 
i = SD = 合 效果 趋 于 稳定 。 设 置 训 练 次 数 为 500 ,隐藏 层 神经 元 

个 数 分 别 为 5.6.7.8 .9 10 11 12 13 ,发 现 当 隐 藏 层 神 经 
元 个 数 为 13 时 ,MAE 和 MSE 值 最 小 。 模 型 C 中 ,最 终 
设置 训练 次 数 epochs 为 500 ,隐藏 层 神 经 元 个 数 为 13。 
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12 ”统计 年 份 为 2018 年 时 1975 -2017 年 公开 专利 
的 被 引 频 次 均值 预测 曲线 
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14 统计 年 份 为 2018 年 时 ,不 同 技术 领域 下 1975 -2017 年 公开 专利 的 被 引 频 次 均值 预测 曲线 
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模型 C 的 最 佳 性 能 曲线 的 示例 如 图 15 所 示 。 横 
轴 代 表 样 本 的 统计 年 份 , 纵 轴 代表 被 引 频 次 的 TOP 
1.00% 百 分 位 。 蓝 色 为 实际 值 , 红 色 为 预测 值 ,绿色 为 
两 者 的 差 值 。 

由 模型 C 可 以 预测 截至 未 来 某 统计 年 份 时 ,不 同 
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公开 年 专利 的 被 引 频次 TOP 分 位 数 。 图 16 是 一 个 预 
测 实例 ,表示 统计 年 份 为 2018 年 时 ,1975 -2017 年 公 
开 专利 的 被 引 频 次 TOP 分 位 数 的 预测 曲线 。 横 轴 代 
表 专 利 公 开 年 份 , 纵 轴 代 表 被 引 频次 TOP 分 位 数 。 
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l6 统计 年 份 为 2018 年 时 1975 -2017 年 公开 专利 的 被 引 频 次 TOP. 分 位 数 预测 曲线 


e 模型 D。 固 定 隐 藏 层 神 经 元 数量 为 5, 调 整训 
练 次 数 epochs, 记录 不 同 训练 次 数 的 预测 误差 。 由 
MAE 和 MSE 变化 情况 得 到 ,训练 次 数 达到 300 时 , 17] 
合 效果 趋 于 稳定 。 设 置 训练 次 数 为 300 ,隐藏 层 神经 


元 个 数 分 别 为 5.6 7.8 9 10 11.12 13 ,发 现 当 隐藏 层 
神经 元 个 数 为 12 时 ,MAE 和 MSE 值 最 小 。 模 型 D 
中 ,最 终 设置 训练 次 数 epochs 为 300 ,隐藏 层 神经 元 个 
数 为 12。 
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模型 D 的 最 佳 性 能 曲线 示例 如 图 17 所 示 。 横 轴 
代表 不 同 技术 领域 下 样本 的 统计 年 份 , 纵 轴 代表 被 引 
频次 的 TOP1. 00% 百 分 位 。 蓝 色 为 实际 值 ,红色 为 预 
测 值 , 绿 色 为 两 者 的 差 值 。 性 能 曲线 显示 , 拟 合 效果 因 
技术 领域 不 同 而 有 差异 ,B TB C. 部 等 技术 领域 的 拟 合 
效果 较 好 ,A BID 部 和 下 部 的 拟 合 效果 还 需 增强 。 
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由 模型 D 可 以 预测 截至 未 来 某 统计 年 份 时 ,不 同 
技术 领域 下 ,不同 公开 年 专利 的 被 引 频 次 的 TOP 分 位 
数 。 图 18 是 一 个 预测 实例 ,表示 统计 年 份 为 2018 年 
时 ,不 同 技术 领域 下 1975 - 2017 年 公开 专利 的 被 引 频 
次 的 TOP 分 位 数 的 预测 曲线 。 横 轴 代 表 专 利 技术 领 
域 与 公开 年 份 , 纵 轴 代 表 被 引 频次 的 TOP 分 位 数 。 
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图 17 模型 D 的 最 佳 性 能 曲线 示例 (TOP1.00% 分 位 数 ) 
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图 18 统计 年 份 为 2018 年 时 ,不 同 技术 领域 下 1975 -2017 年 公开 专利 的 被 引 频 次 TOP. 分 位 数 预测 曲线 


4 总 结 与 展望 

专利 引文 分 析 在 技术 评价 活动 中 应 用 广泛 ,专利 
被 引 频 次 是 专利 引文 分 析 的 重要 指标 。 专 利 被 引 频 次 
受到 时 间 因 素 的 影响 ,使 得 实际 评价 活动 中 ,被 引 频 次 
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的 评价 无 据 可 依 。 基 于 这 一 现状 ,本 文 开 展 了 时 间 
素 对 专利 被 引 频 次 的 影响 研究 。 梳 理 相 关 文献 发 现 ， 
时 间 因 素 对 被 引 频次 的 影响 ,表现 为 三 个 方面 :中 不 同 
年 份 公 开 专利 的 被 引 频次 ,无 法 直接 进行 比较 ;@ 计 算 
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机 技术 的 快速 进步 ,提高 了 专利 审查 员 的 检索 能 力 , 导 
致 专利 被 引 机 会 逐年 增 大 ;@ 只 能 计算 截至 统计 时 间 
点 的 专利 被 引 频 次 ,评价 年 轻 专利 时 误差 较 大 。 这 些 
可 题 的 本 质 在 于 专利 的 不 同 公开 年 份 和 不 同 统计 年 份 
的 时 间 差 异 导致 了 被 引 频 次 无 法 直接 比较 。 本 文 从 当 
前 统计 时 间 点 和 历史 时 序 两 个 角度 出 发 ,采用 固定 效 
应 方法 对 专利 被 引 频次 进行 修正 。 选 取 被 引 频 次 均值 
和 6 个 TOP 百 分 位 数 为 固定 效应 水 平 ,建立 基于 不 同 
技术 领域 .不 同 公开 年 份 . 不 同 统计 年 份 的 被 引 频 次 基 
准 线 。 构 建 BP 网 络 模型 ,对 基准 线 的 历史 时 序 变 化 情 
况 进 行 拟 合 ,训练 得 到 最 优 模型 。 利 用 最 优 模型 ,可 以 
预测 未 来 时 间 点 的 被 引 频次 基准 线 。 文 中 已 经 提供 了 
截至 2018 年 底 统计 时 ,被 引 频 次 的 预测 基准 线 。 研 究 
进程 中 进一步 发 现 , 固 定 公 开 年 不 变 时 ,全 领域 专利 被 
引 闫 次 均值 随 着 统计 年 的 增长 呈现 上 升 趋 势 固定 统 
六 PEN: £9 K I ei gg 


H O naL 
E UA doe b. c DC cd a 
(Efe iH LR B 体 的 一 般 水 平 , 丛 好 验证 了 
noe 


kun AHE x Hen 了 修正 研究 ， 
S 路 上 具有 新 颖 性 。@ 在 专利 领域 缺乏 
同时 间 .不 同行 业 的 专利 文献 引文 测度 基准 。 本 文 
寻访 了 基于 不 同 领域. 不 同时 间 范 围 的 专利 被 引 频 次 
指标 基准 ,使 得 相关 指标 的 评价 有 据 可 依 。@ 前 文 提 
到 过 B. H. Hall 的 研究 开创 了 专利 引文 指标 时 间 因 素 
研究 的 先河 。 遗 憾 地 是 ,该 研究 的 数据 测度 时 间 截至 
1999 年 ,而 1999 年 至 今 又 产生 了 大 量 的 专利 引文 记 
录 , 故 该 研究 无 法 为 当前 专利 引文 指标 的 合理 使 用 提 
供 参考 基准 。 其 他 后 续 研究 也 没有 提出 解决 方案 。 针 
对 专利 被 引 频次 的 基准 值 逐年 变化 且 难 以 计算 的 问 
题 ,本 文 尝试 基于 时 序 变 化 而 不 是 单一 时 间 截 面 ,探究 
专利 被 引 频次 的 基准 值 的 逐年 变化 情况 和 增长 规律 ， 
采用 神经 网 络 模型 拟 合并 预测 未 来 时 间 点 的 基准 值 。 
存在 的 问题 及 未 来 的 研究 方向 :专利 引文 分 析 
包含 很 多 有 价值 的 统计 指标 ,而 本 文 仅仅 关注 专利 被 
引 频 次 指标 。 未 来 可 以 继续 探讨 时 间 因 素 对 其 他 指标 
的 影响 。@ 本 文 提供 了 专利 被 引 频次 的 基准 线 , 但 是 
尚未 将 成 果 运 用 到 实际 工作 中 。 后 续 可 以 开展 实证 研 
究 , 根 据 实际 场景 ,对 时 间 影响 进行 修正 。 通 过 比较 修 
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正 前 后 的 结果 ,探讨 本 文 研究 成 果 的 适用 性 。@® 文 中 
建立 神经 网 络 模 型 对 专利 被 引 频 次 基准 线 的 历史 变化 


规律 拟 合 Mig midi D a pe 的 被 引 频 次 
基准 线 。 未 来 会 进一步 优化 对 基准 线 的 拟 合 预测 , 
we 
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Time Impact Study of Patent Cited Frequency 
Luo Wenxin'^ Zhao Yajuan'” 
' National Science Library, Chinese Academy of Sciences, Beijing 100190 
* Department of Library, Information and Archives Management, School of Economics and Management, 
University of Chinese Academy of Sciences, Beijing 100190 

Abstract. [ Purpose/significance] To study the influence of time factor on patent cited frequency can reduce the re- 
striction of time factor on technical evaluation activities and improve the accuracy and reliability of evaluation. [ Method/ 
process | This paper collected U. S. patent data from 1975 to 2017 , and carried out the revision study of patent cited fre- 
quency based on fixed effect method. The patents were grouped according to different publication years and different tech- 
nieal fields. Group mean and six TOP quantiles were selected as the benchmarks of patent cited frequency, and the bench- 
nfarks of patent cited frequency for both the current time point and the historical time series were counted. Then a neural 
nétwork model was established to fit the timing variation of the benchmarks, thus predicting the benchmarks of future sta- 
tistical time points. | Result/conclusion | The time difference between publication years and statistical years of patents 
nes it impossible to directly compare patent citations. This paper establishes benchmarks for patent citations based on 
différent technical fields, different publication years and different statistical years, providing reference for patent evalua- 
ton. 


Keywords: patent cited frequency time fixed effect timing variation benchmark 


下 期 X HB 


在 线 健 康 社区 老年 用 户 健 康信 息 需 求实 证 研究 基于 指数 随机 图 模型 的 专利 引用 关系 形成 机 制 研 
( 徐 孝 婷 RUCYPBO RAE) 究 一 一 以 奈 拉 滨 药 物 为 例 ( 杨 冠 灿 3) bA FA) 

社会 化 问答 平台 提问 回复 率 的 预测 研究 一 一 以 “百度 基于 网 络 招聘 文本 挖掘 的 课程 知识 模型 自动 构建 
知道 ”为 例 CREF 付 少 雄 刘瑾 ) 人 研究 (AX kæ R7) 
5 GAP 模型 视角 下 图 书馆 营销 策略 探究 基于 kano 模型 的 高 校 图 书馆 微 信 公 众 号 服务 内 容 分 
GKE RF) 类 和 供给 优先 序 研 究 (945 ”周秀 会 ) 
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